首页> 外文OA文献 >A Robust Framework for Classifying Evolving Document Streams in an Expert-Machine-Crowd Setting
【2h】

A Robust Framework for Classifying Evolving Document Streams in an Expert-Machine-Crowd Setting

机译:一种强大的文档流分类框架   专家 - 机器人群设置

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

An emerging challenge in the online classification of social media datastreams is to keep the categories used for classification up-to-date. In thispaper, we propose an innovative framework based on an Expert-Machine-Crowd(EMC) triad to help categorize items by continuously identifying novel conceptsin heterogeneous data streams often riddled with outliers. We unify constrainedclustering and outlier detection by formulating a novel optimization problem:COD-Means. We design an algorithm to solve the COD-Means problem and show thatCOD-Means will not only help detect novel categories but also seamlesslydiscover human annotation errors and improve the overall quality of thecategorization process. Experiments on diverse real data sets demonstrate thatour approach is both effective and efficient.
机译:社交媒体数据流的在线分类中的一个新挑战是保持用于分类的类别是最新的。在本文中,我们提出了一个基于“专家机器人群”(EMC)三元组的创新框架,以通过不断地识别经常被异常值困扰的异构数据流中的新颖概念,来帮助对项目进行分类。通过提出一个新的优化问题:COD-Means,我们将约束聚类和离群值检测结合在一起。我们设计了一种算法来解决COD-Means问题,并表明COD-Means不仅可以帮助检测新颖的类别,而且可以无缝发现人为注释错误,并提高分类过程的整体质量。在各种真实数据集上进行的实验表明,我们的方法既有效又有效。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号